智能论文笔记

mlf-core: a framework for deterministic machine learning

Lukas Heumos , Philipp Ehmele , Luis Kuhn Cuellar , Kevin Menden , Edmund Miller , Steffen Lemke , Gisela Gabernet , Sven Nahnsen

分类：机器学习 | (统计)机器学习

2021-04-15

近年来，机器学习已显示出广泛的增长，现在通常应用于敏感区域。为了在部署前进行适当的预测模型验证，模型必须是确定性的。但是，主要的机器学习库默认用于基于原子操作的非确定性算法的使用。仅修复所有随机种子不足以确定性机器学习。为了克服这一缺点，各种机器学习库发布了与非确定性算法的确定性对应物。我们评估了这些算法对确定性和运行时的影响。基于这些结果，我们为确定性机器学习制定了一系列要求，并开发了新的软件解决方案MLF核心生态系统，该解决方案有助于机器学习项目以满足并保持这些要求。我们应用了MLF核心在各种生物医学领域开发确定性模型，包括带有张量的单细胞自动编码器，基于Pytorch的CT扫描中的基于Pytorch的U-NET模型，以及基于XGBoost的基因表达谱的肝癌分割和基于肝癌的肝癌分类器。

translated by 谷歌翻译